昨天大致了解了embedding,我今天要補充一些並做簡單的實作。
在 AI 的自然語言處理(NLP)應用中,「文字相似度比對」 是非常常見的需求。除了問答系統,還有其他不同的應用,例如:
先去官網取得api(可以參考本系列Day4)
pip install openai numpy
引入openai和numpy(算數學用)
填入api、舉例標題和內容
轉換成向量
計算相似度的公式很簡單,就是高中學過的公式: cos夾角=(A⋅B)/(A×B),大家可以趁這機會複習
找出兩向量的角度
最後我測出來是